查看原文
其他

顾伟 周响|人形机器人生成内容著作权合理使用制度研究

顾伟 周响 上海市法学会 东方法学
2024-10-09

人形机器人内容生成的过程离不开对于海量数据的使用,当越来越多的作品作为数据被用于人形机器人“大脑”的大模型训练,则不可避免地产生著作权侵权争议。在此背景下,人形机器人“创作”的过程中未经许可使用他人作品能否构成合理使用成为问题的核心。通过分析人形机器人生成内容涉及何种作品使用行为及其相应的侵权风险,并结合人工智能生成内容的技术与产业特点分析其对现行著作权合理使用制度的挑战,以期提出有利于平衡著作权人权利保护与人形机器人科技与产业发展的合理使用制度优化建议。

2023年10月20日,工业和信息化部印发《人形机器人创新发展指导意见》(以下简称《意见》)。《意见》指出,“以大模型等人工智能技术突破为引领,在机器人已有成熟技术基础上……发挥制造业门类齐全、应用场景丰富、市场规模庞大以及新型举国体制优势,加快推动我国人形机器人产业创新发展”。人形机器人未来的应用场景十分广泛,医疗、制造、建筑、商贸物流、养老、应急、农业等领域均有其用武之地。不仅如此,2022年,一台名为“Ai-Da”的机器人艺术家在第59届威尼斯双年展上举办个展,这也是威尼斯双年展120年历史上首次有机器人艺术家参展。在人形机器人创作的过程中,操作画笔的是人形机器人的“肢体”,控制“肢体”进行运动的是“小脑”,而决定创作内容的是人形机器人的“大脑”。“大脑”能够理解人类的指令并创作出作品,主要依靠其内置的人工智能大模型。通过海量数据的机器学习训练,例如,海量的美术作品数据,人工智能大模型能够掌握各种元素、风格,最终根据外界的指令,输出自主创作的内容。

未来,随着人工智能与智能制造技术的不断迭代升级,人形机器人将能够完成越来越复杂、越来越具有创造性的任务,随之而来的也有不同场景之下的法律风险。以上文所述人形机器人进行艺术创作的场景为例,基于人工智能大模型的内容生成就可能存在著作权侵权风险,因为人工智能生成内容在大模型训练阶段需要使用海量数据,其中就可能包括他人享有著作权的作品。2023年8月15日起施行的《生成式人工智能服务管理暂行办法》(以下简称《暂行办法》)第7条规定:“生成式人工智能服务提供者(以下称提供者)应当依法开展预训练、优化训练等训练数据处理活动,遵守以下规定:(一)使用具有合法来源的数据和基础模型;(二)涉及知识产权的,不得侵害他人依法享有的知识产权……”目前,《暂行办法》仅规定了大模型训练的数据应当有合法来源且不侵害知识产权,并未明确未经授权将他人作品用于人形机器人人工智能大模型训练的行为是否侵权。

2023年,4位画师将知名社交软件及其开发的AI绘画图片生成模型的主体公司诉至法院,理由是其未经授权使用了画师的原创作品作为训练数据,从而生成了与原作高度相似的图片,侵犯了创作者的著作权。本案是否构成侵权,尚需法院判断二者作品是否构成实质性相似,然而其背后折射出的是大模型训练对于作品数据的需求与创作者著作权保护之间的矛盾。

在域外,也有越来越多的内容创作者以大模型训练侵犯其著作权为由起诉人工智能巨头公司。2023年,Getty Images起诉人工智能巨头Stability AI,称被告未经许可从原告的图片库中复制了超过1200万份图片,用于训练Stability AI的图片生成大模型,侵犯了Getty Images的版权。为了帮助创作者保护著作权,芝加哥大学的科学家还研制出一款名叫“Nightshade”的“数据投毒工具”,此种工具能够帮助艺术家改变其美术作品中的像素。此种像素级别的改变不会被人眼所识别,但却可以误导人工智能的数据提取,从而让大模型以错误的素材进行训练,导致输出结果错乱。

随着人形机器人生成内容技术与产业的不断发展,其必然需要海量数据作为大模型训练的原材料。手握海量数据的企业如何合法地使用创作者的作品,创作者如何在人工智能时代保护自己的著作权不被侵犯,获取合理的经济利益,有待著作权法予以规范。本文主要讨论人形机器人生成内容,在大模型训练过程中的著作权合理使用,以破解人形机器人大模型训练的过程中使用他人作品的困局,促进人形机器人产业的健康发展。

一、人形机器人生成内容内涵界定

首先,需要区别人形机器人和人工智能,界定其所生成内容的内涵和外延。


(一)人形机器人与人工智能

目前,专门针对人形机器人法律问题的研究较少,大量的研究集中在人工智能、智能机器人法律问题。《上海市促进智能机器人产业高质量创新发展行动方案(2023-2025年)》中多处提到“人形机器”,故本文将人形机器人作为智能机器人的类型之一进行讨论。与智能机器人的概念相比,人形机器人概念更强调软件与硬件的统一。根据《意见》,人形机器人技术有四个关键技术群:大脑、小脑、机器肢、机器体。机器肢、机器体等底层硬件技术主要涉及人形机器人的运动表现、能源续航等方面,小脑负责机器肢、机器体的运动控制,大脑是智能”与“机体”结合的关键,而支撑大脑自主学习与决策的,正是人工智能大模型技术。所以,探讨人形机器人法律问题,底层硬件与运动控制仅是执行阶段的因素,核心需要探讨人形机器人“大脑”背后的人工智能技术。


(二)人形机器人生成内容

人形机器人有诸多应用场景,不同的应用场景需要不同的人工智能大模型进行支撑,也面临着不同的法律风险点。随着大众对于数字内容的消费需求不断提高,人形机器人也将在内容生成领域有所应用,本文以此为背景开展著作权合理使用制度的研究。参考中国信息通信研究院对于人工智能生成内容的定义,本文将人形机器人生成内容定义为:从内容生产方式的视角,指人形机器人自动化生成作品的一类技术集合;从内容生产者的视角,指由人形机器人创作的作品。就具体涉及的作品类型,著作权法第3条规定了9种作品类型,本文主要以近年AI文生文、文生图、文生视频、图生视频、AI歌手等人工智能技术为背景,主要讨论人形机器人生成文字、美术、音乐、视听、设计等作品过程中的著作权问题。

二、人形机器人生成内容侵权风险分析

人形机器人所生成的内容具有多样性,存在多种侵权风险。


(一)不构成侵权的情形

人形机器人生成内容对作品的使用分为表达性使用与非表达性使用两种类型。表达性使用即作者使用原作创作新作品,非表达性使用则不会有新作品的产生。有学者总结,非表达性使用是将原作“作为一种事实性信息进行功能性利用”。例如,未来人形机器人在智能安保的应用场景下,其人脸识别功能对于人脸照片的使用,仅为抓取人脸特征而执行识别任务,并不输出与人脸照片特征相似的新内容。再如,对于人工智能文章语言润色软件而言,即便该人工智能的训练过程使用了海量的文字作品,其目的也并非生成与上述作品相似的内容,而是仅为润色由使用者提供的文章。人工智能生成内容对作品的非表达性使用虽然也涉及对原作的复制,但没有表达性的内容输出,不会对原作的市场产生替代,不会影响原作者的利益,故不构成侵权。当然,以上述文章语言润色软件为例,如果该等“润色”对于使用者提供文章的修改过大,以至于产生了与原作独创性表达相似的新作品,则不属于非表达性使用的情形。


(二)复制权侵权风险

1.复制行为




人形机器人生成内容在研发训练阶段,首先就要对海量数据进行复制、储存,以便后续的整理、提取,最终生成内容。这个“机器阅读”过程中必然涉及对作品的数字化复制,具体分为三种情形1)将非数字格式的作品转化为可供机器阅读的数字格式2)直接复制已经转化为数字格式的作品3)将已经转化为数字格式的作品进行格式转换。著作权法第10条第5项规定,复制权,即以印刷、复印、拓印、录音、录像、翻录、翻拍、数字化等方式将作品制作一份或者多份的权利。其中就包括了对作品进“数字化”,足以涵盖上述三种数字化复制情形。另外,由于使用作品进行大模型训练,“机器输出”的作品也极有可能与输入作品构成实质性相似,从而构成对原作的复制。国内对此种类型的著作权侵权已有判例,在广州互联网法院审理的一起著作权侵权纠纷案件中,原告认为,被告(一家AI公司)未经授权,擅自使用原告享有著作权的作品训练其大模型并生成实质性相似的图片,并通过销售会员等方式获利,侵犯了原告权利。法院最终判决被告侵犯原告对案涉作品的复制权、改编权。

2.临时复制




《信息网络传播权保护条例》第21条规定,网络服务提供者为提高网络传输效率,自动存储从其他网络服务提供者获得的作品、表演、录音录像制品,根据技术安排自动向服务对象提供,并具备下列条件的,不承担赔偿责任一)未改变自动存储的作品、表演、录音录像制二)不影响提供作品、表演、录音录像制品的原网络服务提供者掌握服务对象获取该作品、表演、录音录像制品的情况三)在原网络服务提供者修改、删除或者屏蔽该作品、表演、录音录像制品时,根据技术安排自动予以修改、删除或者屏蔽。此条被视为我国立法对于临时复制行为的规定。欧盟2001/29/EC号指令第5(1)条规定,第2条所指的临时复制行为,如果是短暂的或偶然的以及是技术过程中必要的不可分割的组成部分,且其唯一目的是a)使作品或其他客体在网络中通过中间方在第三方之间传输,或(b)合法使用作品或其他客体的,并且该行为没有独立的经济意义,则应不属于第2条规定的复制权。大模型训练过程中对于作品的复制是长期性的,且人形机器人在向服务对象提供生成内容时,必然涉及对于原作品的改变,不会随着原网络服务提供者对于作品的修改等行为自动作出相应的变化。所以,大模型训练不符合上述对于临时复制行为的描述,其涉及复制权侵权风险。


(三)其他著作财产权侵权风险

从机器学习到机器输出的过程,往往不会是对机器阅读过程中获取数据的简单复制。例如,在机器阅读前,需要对数据予以翻译、标记、整理、汇总,这些行为就可能侵犯翻译权、汇编权。如果人形机器人通过“文生视频”“图生视频”等技术生成视听作品,则会侵犯原作品的摄制权。如果人形机器人生成内容既保留了原作的独创性表达,又在该基础上形成了新的特征,例如,融合了通过机器学习而获取的其他作品的特征,则存在侵犯原作品的改编权的风险。如果在人形机器人对生成的作品进行表演的场景下,则可能侵犯原作的表演权。类似的,发行权、展览权、放映权、广播权、信息网络传播权等传播权利均存在侵权风险。


(四)著作人身权侵权风险

著作权法还规定了发表权、署名权、修改权及保护作品完整权等数项人身权利。人形机器人生成作品若未能以恰当的方式标注其使用的原作作者身份,可能侵犯署名权。若未经作者允许对作品进行修改,则可能侵犯修改权。著作权法第10条第4项规定,保护作品完整权,即保护作品不受歪曲、篡改的权利。目前诸如StableDiffusion的人工智能生成内容软件允许用户通过输入提示词的方式生成图片,即“文生图”。如果用于生成图片的文字为作者授权的作品,则通过文字、图片生成图片的“文生图”“图生图”行为,甚至“文生视频”“图生视频”的行为,都可以被解释为属于《著作权法实施条例》中规定“类似摄制电影的方法”创作作品的情形,若构成对原作的歪曲、篡改,则存在侵犯原作者保护作品完整权的风险。最后,若人形机器人获取作品的方式为非法,并使用该非法获取的作品生成内容,则还可能侵犯作者的发表权。

三、人形机器人生成内容规制的域外经验

日本、欧盟、美国对人形机器人生成内容的规制能够为我国提供一定参考经验。


(一)日本

日本著作权法第30条之4规定,在下列任何一种情况下,或在不以个人享受或使他人享受作品所表达的思想或情感为目的的其他任何情况下,允许以任何方式并在必要的范围内使用作品i)如果该行为是为了开发或实际使用与作品的声音或图像的录制有关的技术而进行的测试,或为了进行其他此类利用而进行的测试ii)用于数据分析,指对大量作品或大量其他此类数据的组成语言、声音、图像或其他要素数据进行提取、比较、分类或其他统计分析iii)在计算机数据处理过程中被使用,或以不涉及人类感官感知作品所表达内容的其他方式被利用(对于计算机编程作品,这种使用不包括在计算机上执行作品)。但是,如果根据作品的性质或目的或使用作品的情况,该行为会不合理地损害著作权人的利益,则不在此限。

简言之,在不损害作者权益的前提下,如果使用作品的目的不是为了享受作品含有的思想或感情,则允许使用受版权保护的作品,而无需征得版权所有者的同意。

日本文化厅于2024年3月15日发布了《关于AI与著作权相关问题的意见》(以下简称《AI与著作权意见》),《AI与著作权意见》认为,机器学习阶段对数据的使用符合日本著作权法第30条之4的规定,属于用于数据分析的情形,构成合理使用。《AI与著作权意见》也提出了例外,指出一种只使用特定创作者的少量作品作为训练数据,以便生成受这组作品强烈影响的作品的现象。《AI与著作权意见》认为,在生成式人工智能的开发和学习阶段,这种仅由某一创作者的少数作品组成的作品群,可能会被认为侵犯了创作者的版权。如果为了额外学习的目的有意复制这些作品,目的是让生成的人工智能输出全部或部分相关的创造性表达,那么享受的目的就被认为是并存的。另一方面,如果在生成和使用阶段极其频繁地生成与所学作品具有相同创作表现形式的作品,也可能被视为存在“享受”的目的,从而不构成日本著作权法第30条之4所规定的合理使用情形。


(二)欧盟

欧盟《数字化单一市场版权指令》对文本与数据挖掘(text and data mining)的版权例外作出规定。其中第3条规定,研究机构和文化遗产机构为科学研究目的,对其可以合法获取的作品或其他主题进行文本和数据挖掘而进行的复制和摘录,将使用数据的主体限定为非商业性,具有公益性的研究机构,适用范围较为有限。4条规定了一般情形下的文本和数据挖掘例外,且版权人可以对例外提出保留。

虽然文本与数据挖掘与人工智能生成内容不是完全相同的概念,但是在2024年3月13日欧盟通过的人工智能法案(Artificial Intelligence Act)中,第105段明确地将人工智能大模型训练中使用受版权保护的作品与《数字化单一市场版权指令》中的文本和数据挖掘例外情况对应起来,消除了潜在的争议。人工智能法案强调,除非适用相关的版权例外和限制,否则在训练人工智能模型时使用受版权保护的内容必须获得权利人的授权。

人工智能法案还对在欧洲运营的科技公司和人工智能开发商规定了一系列透明度义务。其中一项核心要求是,使用生成式人工智能或基础人工智能模型(如OpenAI的ChatGPT)的公司必须提供其用于训练系统的任何版权作品的详细摘要。该法案还要求在生成式人工智能中使用的任何训练数据集都要添加水印,以允许作品权利人追溯其作品以保护其权利。


(三)美国

用于判断是否构成合理使用的“转换性使用”概念始于美国的Campbell v. Acuff Rose Music,Inc.案。本案法官认为,与评论和批评一样,戏仿也可以构成合理使用。根据第107条四要素中的第一个要素,“使用的目的和性质,包括该使用是出于商业性目的还是非营利性的、教育性的目的”,判断的重点应是新作品是否以及在多大程度上具有“转换性”,以新的表达方式、意义或信息改变了原始作品。新作品的转换性越强,其他可能会不利于合理使用的认定的因素(如商业性目的)的重要性就越小。

另一个重要的案件为Authors Guild v. Google,Inc.本案原告是受版权保护的已出版图书的作者,他们以侵犯版权为由对谷歌提起诉讼。谷歌在未经权利人许可的情况下,通过其图书馆项目和谷歌图书项目复制了数千万本图书的数字拷贝,其中包括原告的图书。最终法院认为,与存在转换性使用以及与原作不存在重大市场替代竞争的情况相比,商业性目的不应成为更重要的判断因素。谷歌在未经授权的情况下将受版权保护的作品数字化、创建搜索功能并显示这些作品的片段属于非侵权的合理使用。复制的目的是具有高度转换性的,谷歌所展示的内容并没有对原作构成显著的市场替代。谷歌公司的商业性质和盈利动机不能成为拒绝合理使用的理由。可见,法官认为尽管仍然需要使用“四要素”中的“使用的目的和性质”“数量和质量”来判断是否构成合理使用,但一旦认定构成“转换性使用”,则大量的商业性使用也可以构成合理使用。

四、人形机器人生成内容合理使用制度的选择

如何选择人形机器人生成内容合理使用制度,需要认真考量制度背景和意义。


(一)人形机器人生成内容适用合理使用制度的意义

如何在著作权法层面上规制人形机器人生成内容既关系到人形机器人技术与产业的发展,又关系到人工智能时代日益脆弱的创作者权益。

有支持人工智能生成内容适用合理使用制度的学者认为,“大数据时代,人们在信息获取、人权保护方面的需要和价值应当提升”。作者中心主义在这样的时代背景下不应再是著作权法的主导思想。长远来看,合理使用制度可以提升大模型训练可用数据的数量与质量,促进人工智能技术的飞跃。也有支持人工智能生成内容适用合理使用制度的学者从交易成本的角度来论证,认为在新技术发展的初期,若要求“新技术的利用者尚未取得收益之前就要求他们支付很高的许可费”,则会大大增加企业成本负担,提高进入市场的门槛,不利于市场发展。本文赞同上述观点,人形机器人生成内容的发展进化的最基本需求是海量数据,若在人形机器人产业发展伊始将人形机器人生成内容排除出合理使用制度,则必然会扼杀技术与产业的迭代升级。目前,部分人工智能生成内容平台选择使用公有素材库中无版权作品来避免潜在的著作权纠纷,然而此类素材库中的作品数量上限也为大模型的进化升级限定了天花板。


(二)人形机器人生成内容适用法定许可制度的否定

有学者认为,合理使用制度不利于作者权利的保护,进而支持人工智能生成内容适用法定许可制度。法定许可是指法律明确规定实施某种原本受专有权利控制的行为无须经过著作权人许可,却应向著作权人支付报酬。有支持法定许可制度的学者认为,法定许可制度可以实现人工智能时代下社会关系的正义性,称法定许可以平衡“著作权人的专有权利和使用者使用权之间的冲突”。还有学者认为,法定许可制度能够允许著作权人参与分配人工智能生成内容创造的收益,从而实现对创作的激励。

然而,支持人形机器人生成内容适用法定许可制度的观点欠缺对于未来大模型训练使用作品数量的数量级的考量。2024年4月,昆仑万维公司公布了其包含4000亿参数的大模型“天工3.0”,它超越了由美国企业家马斯克开源的3140亿参数的Grok-1,成为全球最大的开源MoE(混合专家模型)大模型。如此庞大的参数量,所需要的数据量动辄上万亿。例如,vivo公司的“蓝心大模型”仅仅使用的文本数据量就达到了15TB,相当于2.5个中国国家图书馆的藏书量。如果大模型训练面临着如此庞大的法定许可报酬支付需求,无疑将大大增加企业的研发成本,制约人形机器人技术与产业的发展。并且,在如此巨大的数据量级背景下,即便单个作品的作者能通过法定许可制度或者报酬,平均到每位作者的报酬数额不可能太大。以我国《教科书法定许可使用作品支付报酬办法》的规定来对比,该办法第4条规定,教科书汇编者支付报酬的标准为:(一)文字作品:每千字300元,不足千字的按千字计算;(二)音乐作品:每首300元;(三)美术作品、摄影作品:每幅200元……。即便是降低至上述报酬支付标准的1%,例如音乐作品每首3元,人形机器人企业需要支付的报酬也是天文数字。而若是在人形机器人企业能够承受的范围内支付报酬,平均到每份单个作品的报酬则微乎其微,对于创作者的“激励”也无从谈起。

五、现有合理使用制度难以适用于人形机器人生成内容技术

合理使用泛指在特定情况下,法律允许他人自由使用享有版权的作品而不必征得权利人许可的合法行为。著作权法第24条规定了合理使用制度:“在下列情况下使用作品,可以不经著作权人许可,不向其支付报酬,但应当指明作者姓名或者名称、作品名称,并且不得影响该作品的正常使用,也不得不合理地损害著作权人的合法权益”,随之以列举的方式规定了12种合理使用的类型。然而,人形机器人生成内容无法适用这12种情形的任一种。著作权法第24条第(13)项规定了“法律、行政法规规定的其他情形”作为兜底条款,但目前尚未有相关法律法规对此做出规定。


(一)个人学习、研究或者欣赏使用

著作权法第24条第1项将为个人学习、研究或者欣赏,使用他人已经发表的作品列为合理使用的情形。即便人形机器人使用作品进行的大模型训练、“机器学习”可以勉强被解释为“学习、研究”的行为,人形机器人是否能够界定为“个人”,也存在争议。有观点认为,人工智能机器人虽具有智性,但不具备人之心性和灵性,与具有“人类智慧”的自然人和自然人集合体不能简单等同,不足以取得独立的主体地位。也有观点认为,将人工智能机器人纳入“法律人”的范围,认可其权利主体资格,合乎社会发展趋势,有助于厘清新型社会关系与秩序。本文赞同第一种观点,尤其鉴于开展人形机器人大模型训练的主体,目前来看多为科技巨头公司。人形机器人的所谓“个人学习、研究”,其最终目的,至少在现阶段而言,是为了打造、升级科技公司的产品,而并非满足人形机器人自身对于学习的需求,故人形机器人很难被解释为著作权法中的“个人”。综上所述,从主体的角度来看,人形机器人生成内容无法被解释为个人使用从而构成合理使用。


(二)课堂教学或者科学研究使用

著作权法第24条第6项规定:“为学校课堂教学或者科学研究,翻译、改编、汇编、播放或者少量复制已经发表的作品,供教学或者科研人员使用,但不得出版发行”。首先,大模型训练的目的,早已经不限于学习、研究、教学等非商业性目的。例如,有的公司已经开始使用人工智能生成内容批量制作海报,用于影视商业宣发。并且,在产学研深入合作的时代背景下,即便是高等院校和科研机构的科研,也可能是与营利性企业合作的一部分,故区分出单纯的科研行为难度较大。其次,“不得出版发行”也很难符合当下人工智能生成内容的实际应用。实际上,早在2017年,微软公司的人工智能虚拟机器人“小冰”的诗集《阳光失了玻璃窗》就由国内出版社正式出版,被称为“人类历史上第一部机器人写的诗集”。并且,大模型训练中对于海量数据的使用,量级巨大,也无法适用“少量复制”的规定。综上所述,人工智能生成内容大模型训练无法适用“课堂教学或者科学研究使用”的规定。


(三)为陈列或者保存版本而复制

著作权法第24条第8项规定:“图书馆、档案馆、纪念馆、博物馆、美术馆、文化馆等为陈列或者保存版本的需要,复制本馆收藏的作品。”此项限定了复制作品的主体为图书馆等社会公共文化机构,限定了客体为由本馆收藏的作品,限定了复制作品的目的是陈列或保存版本。人工智能生成内容较难符合本条的诸多限制条件。首先,大模型训练需要极大资金支持,以算力资源为例,从硬件如高性能计算机等,到电力成本,人工运维成本等,都需要大量投入。根据美国斯坦福大学于2024年4月发布的《2024年人工智能指数报告》,大模型训练的成本还在持续攀升,OpenAI的GPT-4等前沿模型系统的训练成本约为7800万美元,而谷歌的Gemini Ultra的训练成本则达到了1.91亿美元之多。诸如图书馆、纪念馆等社会公共文化机构显然无法承担人工智能大模型如此高昂的开发成本,从而成为符合构成合理使用的主体。

六、人形机器人生成内容合理使用制度构建

著作权法第24条第13款规定了“法律、行政法规规定的其他情形”作为兜底条款,但目前尚未相对应的法律法规予以参照。有学者认为可以参考最高人民法院于2011年出台的《关于充分发挥知识产权审判职能作用推动社会主义文化大发展大繁荣和促进经济自主协调发展若干问题的意见》(以下简称《最高院意见》)的内容。《最高院意见》第8条规定,在促进技术创新和商业发展确有必要的特殊情形下,考虑作品使用行为的性质和目的、被使用作品的性质、被使用部分的数量和质量、使用对作品潜在市场或价值的影响等因素,如果该使用行为既不与作品的正常使用相冲突,也不至于不合理地损害作者的正当利益,可以认定为合理使用。下文以现行著作权法第24条确立的“三步检验法”及《最高院意见》中“促进技术创新和商业发展”的精神作为前提与基础,讨论我国人形机器人生成内容合理使用制度构建的后半篇文章。


(一)被使用作品的数量:占总数据集的比例

2016年,微软公司多家大学、美术馆、博物馆,分析168263个伦勃朗作品的片段,并将分析结果转换成数据进行大模型训练,最终通过人工智能生成内容创作了名为《下一个伦勃朗》的美术作品,这幅作品与伦勃朗的任何一幅作品都不构成近似,但在风格上却与伦勃朗别无二致。

有学者将上述对特定作者的作品用于大模型训练的行为称作“个人表达型机器学习”,并认为此类人工智能偏向于去学习风格更为显著,技术上更容易被模仿,市场上更具价值的“创新型、领军型的知名作者”,进而会对市场造成更大的损害。本文赞同此种观点。将特定作者的作品用于人形机器人大模型训练,由于被使用作品占整个数据集的比例过大,其生成内容也更容易与原作构成实质性相似,故此种对于作品的使用无法落入合理使用的范畴。


(二)不合理地损害著作权人的合法利益

1.转换性使用




美国版权法第107条规定,判定是否属于合理使用需要考虑四个因素:(1)使用的目的和性质,包括该使用是出于商业性目的还是非营利性的、教育性的目的;(2)版权作品的性质;(3)与版权作品整体相比所使用部分的数量和质量;(4)使用对版权作品潜在市场或价值的影响。但由于此项规定的模糊性,有法官在判例中提出了“转换性使用”的概念,即若对原作的使用行为用新的表达、含义或意义改变了原作,则该等使用属于转换性使用,构成合理使用。我国虽然没有对于“转换性使用”的成文规定,但已经有法官在判决书中引用此概念进行说理。

个案中,上海知识产权法院认为,涉案电影海报中作为背景图案引用涉案作品不会产生替代性使用,亦不会影响权利人的正常使用,涉案美术作品被被上诉人引用在电影海报中之后“具有了新的价值、意义和功能,其原有的艺术价值功能发生了转换,而且转换程度较高,属于我国著作权法规定的为了说明某一问题的情形”,从而符合著作权法第24条第3项规定的情形。个案中,北京市高级人民法院认为:“涉案信息网络传播行为所采取的片段式的提供方式,及其具有的为网络用户提供方便快捷的图书信息检索服务的功能及目的,使得该行为构成对原告作品的转换性使用行为,不会不合理地损害原告的合法利益。”

如上文所述,可以通过是否有新作品产生来判断表达性使用与非表达性使用,如果为非表达性使用则无著作权侵权风险。而在表达性使用的情形下,可以通过是否构成转换性使用来判断是否构成合理使用,即在有新作品产生的情况下,其是否呈现出与原作不同的新用途或新表达,是否让原作品展现出创造性变化。也有学者将转换性使用分为“目的转换性使用”与“内容转换性使用”。上述谷歌相关案例中,谷歌公司使用作者的作品用于实现图书信息检索功能,即构成目的性转换性使用。在上述美术作品相关案例中,法院认为美术作品被引用在涉案电影海报中具有了新的价值、意义和功能,其原有的艺术价值功能发生了转换,而且转换程度较高。此种类型即为内容性转换性使用。

事实上,如果人形机器人生成内容对作品的使用构成转换性使用,则说明生成的新作品与原作的目的、内容均存在明显不同,也可以进而证明新作品并未与原作品构成市场竞争和市场替代的关系,不存在市场替代是构成转换性使用的应有之义。综上所述,如果人形机器人生成内容呈现出与原作品不同的用途或表达,则无论是否出于商业目的,均可以构成对作品的转换性表达,进而有可能构成合理使用。

2.比例原则




对于何为“著作权人的合法利益”,有学者指出,著作权法的规定从文义上已经体现了比例原则的要求。北京市高级人民法院知识产权庭发布的《侵害著作权案件审理指南》也将比例原则用于著作权“停止侵害的例外”,称“著作权侵权抗辩如果被告停止被诉侵权行为可能有悖公序良俗,或者违反比例原则的,可以不判令停止侵害,宜根据案件情况从高确定赔偿数额或者判令被告支付相应的对价”。

依据比例原则,判断人形机器人生成内容是否构成合理使用应当对适当性原则、必要性原则以及均衡性原则进行综合考察。首先,应当考察行为是否符合相适性原则,即对人形机器人生成内容对作品的使用是否能够实现某些特定的公共政策目的,例如,推动人形机器人技术创新、人形机器人产业发展等,以及在多大程度上能够实现这一目的进行分析。第二是必要性原则,在“适当性”原则已获肯定后,在能达成前述公共目标的各种方式中,人形机器人生成内容对作品的使用是否是不可避免或必要的,或者是对作者权利侵害最少的方式。第三是均衡性原则,即考察人形机器人生成内容对作品的使用与其所达到的公共政策目的之间是否均衡。


(三)指明作者姓名或名称、作品名称

著作权法第24条规定:“在下列情况下使用作品,可以不经著作权人许可,不向其支付报酬,但应当指明作者姓名或者名称、作品名称……”,体现了合理使用制度中对于作者署名权等精神权利的保护。

2023年3月16日,美国唱片业协会(RIAA)联合美国独立音乐协会等社会团体共同发起“人类艺术运动”(Human Artistry Campaign),在此运动的核心原则中,有一条即为应对受版权保护的作品、表演和类似作品,包括它们被用于开发和训练任何人工智能系统的方式,进行完整记录。除了获得适当的许可外,人工智能生成的内容应该标注其输入作品,描述用于创建它的所有输入内容和方法,以保护创作者和版权持有者。其对于作者精神权利的保护与著作权法第24条对于应当指明作者姓名或者名称、作品名称的要求是一致的。算法的透明性也有助于作品的作者或者权利人在百亿级的数据集中清晰地辨识出自己的作品,从而更好地维护自身权利。

虽然人形机器人生成内容需要使用海量数据而使得其对于作者姓名或者名称、作品名称的保护显得较为困难,新技术的出现可以帮助实现此种记录与标注。数字版权管理(Digital Rights Management,DRM)是从生成、分发、传输、使用到传播等过程对数字内容全生命周期的版权保护技术。此种技术可以允许作者或权利人在将受版权保护的作品中添加水印、robots协议或者添加密钥。通过此种方式,作品将自带包括作者姓名或名称、作品名称在内的诸多信息,并且可以在大模型训练的过程中被识别及复制,从而确保作者或其他权利人能够在人形机器人生成内容中追溯到对自己作品的使用。

还有学者提出应建立人工智能时代的著作权公益诉讼制度。本文赞成此种观点。法律从根本上具有调整利益关系的功能,法律的公平正义也体现在利益的平衡之中。在人形机器人生成内容引起的争议之中,天平的两端即为人形机器人企业与作品权利人。如上文所述,由于开发训练人工智能大模型需要极大的投入,致使人形机器人企业多为科技巨头,且其掌握着大模型的核心算法。相比之下,除了Getty Images等商业图库公司之外,大量的作品权利人为自然人,其往往处于弱势的地位,其对自己的作品是否被使用往往难以举证,且高昂的诉讼成本也可能让其望而却步。建立著作权公益诉讼制度,在人形机器人企业拒绝指明作者姓名或名称、作品名称,或在未构成合理使用的情形下未经作者同意使用作品导致大批量侵权行为之时,检察院可以成为著作权公益诉讼的原告,向法院提起著作权公益诉讼,维护作品权利人的合法权益。


(四)小结

综上所述,对于人形机器人生成内容合理使用制度构建建议如下,即在现行著作权法第24条规定的12种构成合理使用的前提情形之外,增加一种情形:“为人工智能大模型训练,使用他人已经发表的作品”。在符合上述“为人工智能大模型训练,使用他人已经发表的作品”情形的前提下,仍需满足如下要件:1.指明作者姓名或者名称、作品名称;2.不得仅使用特定创作者的作品作为训练数据集;3.不得不合理地损害著作权人的合法权益,方构成对作品的合理使用。

结语

人形机器人在内容生成领域的发展,为我国著作权的制度带来了机遇与挑战。习近平总书记在与金砖国家领导人第十四次会晤期间曾指出:“谁能把握大数据、人工智能等新经济发展机遇,谁就把准了时代脉搏”。大模型训练作为人形机器人生成内容的基础,其对于作品的使用存在着相当的著作权侵权风险。构建人形机器人生成内容合理使用制度,一方面有利于在人形机器人大模型开发的初始阶段打好法律的基础,从前端进行预防性规制,助力人形机器人企业合法合规发展,另一方面也有利于催生公平的利益分配方式,平衡好人形机器人企业与创作者之间的利益。

往期精彩回顾

汪思敏 赵肖斌|金融外商投资安全审查限度问题研究

吴熙辰|新型“网络海盗”的安全风险及其法律规制

金以豪|民营企业产权的刑法保护向度——以职务侵占罪为视角

李幸洁 王骞|我国电子商务平台知识产权行政保护探析

目录|《智慧法治》集刊2024年第1卷

许燕佳|手术机器人介入下医疗事故罪的认定——以“严重不负责任”的认定为核心

上海市法学会官网

http://www.sls.org.cn


继续滑动看下一个
上海市法学会 东方法学
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存